HYDRA-X: Modelo multimodal unificado con tokenizador visual holístico
HYDRA-X unifica tokenización de imágenes y video en un solo ViT. Mejora edición y comprensión multimodal. ¡Descubre cómo!
HYDRA-X unifica tokenización de imágenes y video en un solo ViT. Mejora edición y comprensión multimodal. ¡Descubre cómo!